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RESUMO 


Diversas técnicas de análise de séries temporais têm sido 
propostas na literatura com a finalidade de sumarizar as 
características de uma série temporal, e desta forma, 
determinar a dinâmica subjacente de um sistema ou 
predizer como o mesmo evolui com o tempo. Como 
as medidas obtidas por essas técnicas não preservam 
necessariamente todas as propriedades de uma série 
temporal, novas técnicas têm sido propostas para capturar 
informações adicionais ou quantificar séries temporais 
de novas formas. Neste livro é apresentada uma técnica 
que permite mapear uma série temporal em uma rede 
complexa com uma operação inversa aproximada, 
tornando possível a utilização de estatísticas em redes 
complexas para a caracterização de séries temporais e 
vice-versa. Em seguida, tal técnica foi aplicada em um 
conjunto de séries temporais com diferentes dinâmicas 
e demonstrou-se que a mesma retém a maior parte 
da informação embutida na série temporal (ou rede 
complexa) correspondente após a aplicação da mesma 
e de sua inversa. Após sua proposição e validação, essa 
mesma técnica foi utilizada como um método alternativo 
para o cálculo do expoente de Hurst de uma série 
temporal. Mais especificamente, tal expoente foi definido 
como o expoente da lei de potência do comprimento do 
salto médio, realizado por um caminhante aleatório sobre 
as redes complexas associadas. A técnica proposta foi 
também utilizada no estudo de doenças neurológicas, 
tais como, a epilepsia e o Alzheimer. Para a epilepsia, as 
análises realizadas mostraram que a mesma foi capaz 
não só de diferenciar pacientes sadios de pacientes 
doentes e identificar diversas crises epilépticas, mas 
também de distinguir os diferentes padrões (estágios) 
das crises, tais como o pré-ictal (alterações nos dados de 
EEG antes de uma crise) e ictal (alterações nos dados de 
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EEG durante uma crise). Para o Alzheimer, os resultados 
obtidos mostram que essa técnica mostrou-se eficiente 
na: i) diferenciação dos grupos de idosos sadios e com 
a doença de Alzheimer; ii) identificação das regiões 
do cérebro mais afetadas pela doença em seu estágio 
avançado e (iii) comparação dos métodos computacionais 
mais utilizados na literatura no que diz respeito à acurácia 
da classificação dos indivíduos pertencentes a diferentes 
grupos e ao custo computacional despendido por tais 
métodos nessa classificação. 


PALAVRAS CHAVE: Séries Temporais; Redes Complexas; 
Grafos de Quantis; Coeficiente de Hurst; Epilepsia; Doença 
de Alzheimer. 
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CAPÍTULO 1 
INTRODUÇÃO 


Este livro apresenta uma compilação dos artigos 
publicados recentemente pelos autores nas áreas de análise 
de séries temporais e de redes complexas. No primeiro artigo 
aqui descrito foi proposta uma técnica, até então inédita, para 
o estudo de séries temporais por meio de redes complexas 
(e vice-versa). Nos demais artigos aqui descritos são 
apresentadas as aplicações desse mapeamento na análise de 
séries temporais sintéticas e reais. Em destaque, no estudo de 
doenças neurológicas, tais como, a epilepsia e o Alzheimer. 

Em estatística e em processamento de sinais, uma série 
temporal é definida como uma sequência de medidas, obtida 
em tempos sucessivos e espaçada em intervalos de tempo 
uniformes. A caracterização da dinâmica de um sistema a partir 
de séries temporais sintéticas e experimentais é um problema 
de interesse contínuo em uma grande variedade de campos 
de investigação científica. A mesma é utilizada, por exemplo, 
na identificação e classificação de condições patológicas de 
pacientes a partir de dados de eletroencefalograma, respiração, 
batimento cardíaco e pressão arterial pulmonar, o que permite 
inúmeras possibilidades de procedimentos terapêuticos não- 
invasivos e o aumento da capacidade de diagnóstico [8, 7, 63, 
46, 47]. 

É conhecidanaliteratura a existência de um grande número 
de técnicas de análise de séries temporais [86, 87, 92, 81] e 
que elas permitem pesquisadores sumarizar as características 
de uma série temporal, e desta forma, determinar a dinâmica 
subjacente de um sistema ou predizer como o mesmo evolui 
com o tempo. Como as medidas obtidas pelas mesmas não 
preservam necessariamente todas as propriedades da série, 
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novas técnicas têm sido propostas para capturar informações 
adicionais ou quantificar essas séries de novas formas [104, 
59, 95, 9]. Em paralelo, nas últimas duas décadas, a pesquisa 
em redes complexas se tornou o foco de ampla atenção, com 
aplicações em diferentes áreas da ciência, sobretudo devido 
ao fato de qualquer estrutura discreta poder ser representada 
por um grafo, cujas propriedades podem ser caracterizadas, 
analisadas e, eventualmente, relacionadas com a dinâmica 
dessa estrutura. [17]. 

Nesse sentido, nas décadas passadas foram propostas 
diversas técnicas computacionais fundamentadas no 
conceito de redes complexas. Tratam-se de mapeamentos 
que codificam uma série temporal em uma rede complexa, 
baseados em conceitos como periodicidade [104], visibilidade 
[57, 66], correlações [103], análise de recorrência [69] e 
reconstrução do espaço de fase [101, 32]. Esses estudos 
demonstraram que, independentemente do mapeamento 
utilizado, séries temporais com características distintas 
possuíam representações em redes complexas com topologias 
distintas [35]. Contudo, a estrutura da rede complexa resultante 
dos mapeamentos citados era, até então, bastante sensível à 
escolha de diversos parâmetros, tais como, o tempo de atraso, 
a dimensão de imersão e a limiarização, necessários para a 
reconstrução do espaço de fases e a análise de recorrência. 
Vale ressaltar que, nesse período, não estava claro como a 
análise de séries temporais poderia ser útil na investigação das 
propriedades topológicas de uma rede complexa. Isso porque, 
os mapeamentos citados anteriormente não possuíam uma 
operação inversa, impedindo a criação de uma representação 
dual entre uma série temporal e uma rede complexa. 


Introdução 


A proposição de um mapeamento de séries temporais 
em redes complexas, com uma operação inversa, não é 
um processo trivial. Isso porque, uma vez mapeada uma 
série temporal em uma rede complexa, se faz necessário o 
conhecimento da ordem temporal dos vértices da rede para a 
reconstrução da trajetória da série associada. O mapeamento 
inédito de uma série temporal em uma rede complexa (chamado 
de mapeamento em Grafos de Quantis (GQ)), proposto pelos 
autores deste livro e por colaboradores [16], foi o primeiro 
a possuir uma operação inversa aproximada, permitindo 
não somente a análise de séries temporais se beneficiar da 
pesquisa relacionada a redes complexas [74, 17], mas a teoria 
de redes complexas ser capaz de utilizar mais de três séculos 
de pesquisas teóricas e aplicadas em séries temporais. De 
modo geral, os resultados obtidos nesse trabalho indicaram 
que o mapeamento em quantis (direto e inverso) foi capaz de 
preservar informações estruturadas e não estruturadas nos 
domínios série temporal e rede complexa, sob sucessivas 
aplicações do mesmo. 

Após a proposição do mapeamento GQ, diversos 
mapeamentos de séries temporais em redes complexas 
foram propostos na literatura [34, 24, 21, 100, 50, 106, 43, 
71, 33, 54, 70]. Porém, poucos deles possuíam uma operação 
inversa [106, 43, 54, 70], assumindo certas condições 
de reconstrutibilidade, onde os parâmetros associados à 
reconstrução eram estimados empiricamente para garantir a 
consistência topológica entre a série temporal reconstruída e 
a série original [35]. De modo geral, os mapeamentos aqui 
citados foram utilizados no estudo de sistemas dinâmicos a 
partir de séries temporais fisiológicas, financeiras, turbulentas 
e geofísicas [35]. 
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Posteriormente, o mapeamento GQ foi generalizado pelos 
autores [15], de modo a considerar as correlações de curto 
e longo alcance em uma série temporal para a construção 
de sua rede complexa associada. Além disso, em tal artigo 
foi proposto um caracterizador inédito de rede complexa — 
o comprimento do salto médio. Esse mapeamento foi então 
aplicado em diversas séries temporais com estruturas auto- 
similares, sendo cada uma dessas séries caracterizada por 
dois parâmetros: 8 — o expoente da lei de potência de seu 
espectro de potência e H — o coeficiente de Hurst. Devido a 
não-estacionaridade intrínseca em séries temporais reais, a 
estimativa do coeficiente de Hurst associado necessita de 
métodos mais robustos que os produzidos pela análise de 
Fourier [58, 20]. Nesse sentido, esse artigo definiu H como 
sendo o expoente da lei de potência do comprimento do salto 
médio, realizado por um caminhante aleatório, em uma rede 
complexa associada a uma dada série temporal [15]. 

Esse mesmo mapeamento foi utilizado pelos autores 
e colaboradores no estudo da epilepsia [13, 14, 91]. Nesse 
sentido, tal estudo foi dividido em duas frentes, ambas 
desenvolvidas a partir de dados de EEG que são biomarcadores 
neurofisiológicos dessa doença. A primeira frente de estudo 
está relacionada à classificação de indivíduos em diferentes 
condições patológicas, asaber, i) indivíduos sadios, ii) indivíduos 
com epilepsia sem episódios de convulsão e iii) indivíduos com 
epilepsia e com episódios de convulsão [13, 14]. As análises 
realizadas mostraram que o mapeamento em estudo foi capaz 
não só de diferenciar pacientes sadios de pacientes doentes, 
mas também de distinguir os diferentes padrões (estágios) de 
uma crise epiléptica, tais como o estágio pré-ictal (alterações 
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nos dados de EEG antes da crise) e o estágio ictal (alterações 
nos dados de EEG durante a crise). Convém ressaltar que 
no artigo relacionado a esse estudo [14] foi proposta uma 
forma alternativa e menos custosa computacionamente para o 
cálculo do comprimento do salto médio, baseada no operador 
“traço” de uma matriz. 

Os resultados obtidos na primeira frente de estudo 
permitiram a criação de uma nova frente, baseada na 
identificação de crises epilépticas em pacientes com epilepsia 
[91]. Como tais crises estão frequentemente associadas à 
elevações de amplitude em um sinal de EEG e sua discretização 
por quantis pode agrupar em um mesmo quantil valores de 
alta e baixa amplitude, comprometendo a identificação de tais 
crises, o mapeamento em estudo foi ligeiramente modificado 
utilizando o conceito de bins. Análises feitas mostraram 
que o mapeamento em quantis se mostrou altamente eficaz 
na identificação de períodos sem e com crises epilépticas, 
apresentando valores elevados de acurácia, sensibilidade e 
especificidade na classificação dos mesmos. 

O mapeamento GQ foi também utilizado pelos autores 
e por colaboradores no estudo da doença de Alzheimer (DA) 
[78, 79] a partir de dados de EEG que, analogamente ao caso 
da epilepsia, são biomarcadores da DA. Para isso, foi utilizada 
uma pequena compilação de sinais de EEG em diferentes 
regiões da superfície do couro cabeludo de 24 indivíduos 
saudáveis e de 24 indivíduos com a doença. Os resultados 
obtidos mostraram que esse mapeamento mostrou-se eficiente 
na: i) classificação de pacientes em diferentes condições 
patológicas, ii) identificação dos canais com maior capacidade 
discriminativa em tal classificação e iii) identificação dos 
estágios em que se encontravam os pacientes com a DA. 
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Diversos estudos mostram que a DA ocasiona a diminuição 
dos ritmos cerebrais, a perda de sincronia entre as diversas 
regiões do cérebro e, consequentemente, a redução da 
complexidade dos sinais de EEG [42]. Nesse sentido, diversos 
métodos computacionais têm sido utilizados com o intuito de 
capturar tais alterações neurológicas, a saber, a coerência 
Wavelet, a dimensão fractal, a entropia quadrática, a energia 
Wavelet e o método da visibilidade [48, 52, 82, 48, 57]. Além 
do mapeamento em quantis, essas técnicas foram aplicadas 
em sinais de EEG de diferentes regiões da superfície do couro 
cabeludo de 24 indivíduos saudáveis e 160 indivíduos com 
a DA. Observou-se que o mapeamento GQ se mostrou a 
técnica mais eficaz na classificação dos indivíduos em estudo 
e, também, um dos menos custosos em termos de tempo de 
processamento [97]. 

Em resumo, os trabalhos apresentados e discutidos 
neste livro são: “Duality between time series and networks” 
[16], “Hurst exponent estimation of self-affine time series 
using quantile graphs” [15], “Automated EEG signals analysis 
using quantile graphs” [13], “Application of quantile graphs 
to the automated analysis of EEG signals” [14] e “Automatic 
identification of interictal epileptiform discharges with the use 
of complex networks” [91], “Use of complex networks for the 
automatic detection and the diagnosis of Alzheimer's disease” 
[78], “Quantile graphs for EEG-based diagnosis of Alzheimer's 
disease” [79] e “Computational methods of EEG signals analysis 
for Alzheimer's disease classification” [97]. Procurou-se definir 
uma notação única em todo o texto e organizá-lo de forma a 
apresentar os principais resultados obtidos em cada trabalho, 
bem como definir algumas perspectivas de trabalhos futuros. 
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CAPÍTULO 2 


DUALIDADE ENTRE A ANÁLISE DE SÉRIES 
TEMPORAIS E DE REDES COMPLEXAS 


Campanharo et al. [16] propuseram um mapeamento de 
uma série temporal X € T em uma rede complexa g E G, onde X 
=(x(Dlte N, x) ERje g=(N, A) é um conjunto de vértices N 
e arcos A. Esse mapeamento, aqui chamado de mapeamento 
em quantis, tornou possível a análise da dinâmica de uma série 
temporal por meio de um conjunto extenso de propriedades 
topológicas da rede complexa associada. Dada uma série 
temporal X, primeiramente seus Q quantis são identificados, e 
então, cada quantil q, é associado a um vértice n, E N na rede 
correspondente. Dois vértices n, e n, estarão conectados na 
rede com um arco (n, n, 7) E L, onde o peso W, de cada arco 
é dado pelo número de vezes que um dado ponto x, no quantil 
q, é seguido por um ponto x,, no quantil q, (Fig. 2.1). 

O mapeamento de uma série temporal em uma rede 
complexa proposto nesse trabalho, denotado por M,, 
possui duas propriedades importantes. Primeiramente, ele 
é sobrejetivo. Dada uma série temporal X com T pontos e Q 
quantis, o mesmo produzirá uma e somente uma rede complexa 
g= MylX]. Contudo, séries temporais distintas X e X' podem 
ser mapeadas em uma mesma rede complexa g = MIX] = 
M1X']. Segundo, esse mapeamento requer a especificação 
de um único parâmetro, que pode ser obtido através da relação 
OQ =2VTI72]. 

O mesmo ainda apresentava uma vantagem significativa 
em relação a diversos mapeamentos existentes até então, 
já que possui uma operação inversa aproximada Mar . Tal 
operação consiste na realização de um caminho aleatório sobre 
a rede com probabilidade Wo dada pela matriz de adjacência 
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com pesos W, de tal forma que É w=1 (Fig. 2.1). Iniciando-se 
de um vértice aleatório, a série temporal é construída através 
da realização deste caminho, onde a probabilidade de mover- 
se do vértice n, para o vértice n, é dada por Wo A associação de 


cada vértice da rede a um quantil na série temporal resultante 
X é feita por meio do reordenamento da matriz de adjacência 
com pesos W, de tal forma que a mesma possua seus maiores 
elementos w, próximos da diagonal [84]. Desta forma, é possível 
construir a série temporal dividindo seu domínio em Q quantis 
e escolher aleatoriamente um valor pertencente ao quantil 
correspondente. É importante enfatizar que a associação 
entre quantis e vértices proposta nesse trabalho permite que 
a Série temporal resultante seja o mais suave possível — 
uma propriedade muito comum em diversas séries temporais 
empíricas. 
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Série temporal, X 
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No ooo 
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O | 000 010 0.30 0.60 
O | 0.40 050 0.00 010 

0.00 0.00 0.70 0.30 


(O) 
Matriz de transição reordenada 


Figura 2.1: Ilustração do mapeamento proposto. Mapeamento direto: 
Uma série temporal X é mapeada em uma rede complexa g com Q 
= 4 vértices (quantis). Transições repetidas entre quantis resultam 
em arestas na rede com pesos maiores (representados por linhas 

mais grossas). Mapeamento inverso: A partir de uma rede complexa 

9, constituída de Q = 4 vértices, é construída uma série temporal 
X movendo-se aleatoriamente T passos de um vértice n, para um 
vértice n, com probabilidade w, 


Fonte: Figura adaptada de [16]. 


Tal como o mapeamento direto M ., o mapeamento inverso 


ar 
Mor também possui algumas propriedades importantes. 
Ele é também sobrejetivo. Dada uma rede complexa g, o 
mapeamento irá produzir uma série temporal X = Mor [9, e] 
sobre uma realização €, contudo, redes complexas distintas g 
e g' podem ser mapeadas em uma mesma série temporal X = 


Mor Lg, el= Mor Ig”, el. 
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Apesar deste mapeamento não ser estritamente um-para- 
um devido à presença de estocasticidade, ou seja, Mor [9, 
el Mar [9, €], as séries temporais resultantes de diferentes 
realizações, sobre uma mesma rede, terão propriedades 
bastante similares. 

O mapeamento direto M,, foi aplicado em um conjunto 
de séries temporais com características regulares à totalmente 
aleatórias, dado por: 


mod (x(t— 1) +ó+7,,1), com probabilidade p, 


mod (x(t — 1) + 6,1), caso contrário, 


onde 1 é uma variável aleatória obtida de uma distribuição 
uniforme entre [0, 1] e p parametriza a probabilidade com que 
este ruído modifica a série periódica original. Tomando-se p 
= 0,102, 1071, 10º e ô = 0,05, séries temporais foram geradas 
com 7 = 320 pontos cada (Fig. 2.2). 

Mor foi então aplicado nas séries temporais obtidas 
através da relação (2.1) utilizando-se Q = 20 quantis. As séries 
temporais e redes complexas obtidas por esse processo 
foram denominadas “primeira geração” de séries temporais e 
redes complexas, respectivamente. A Figura 2.2 mostra que 
séries temporais com propriedades distintas são mapeadas 
em redes complexas com propriedades topológicas distintas. 
Especificamente, à medida que as séries temporais se tornam 
mais aleatórias, as redes complexas associadas também se 
tornam mais aleatórias, como no modelo de redes “pequeno 
mundo” de Watts & Strogatz [98]. 
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Em seguida, o mapeamento inverso My foi aplicado na 
primeira geração de redes complexas para se obter a segunda 
geração de séries temporais, cada uma com T = 320 pontos. 
Por simplicidade, assinalou-se cada quantil ao mesmo quantil da 
primeira geração de séries temporais. É visível a similaridade entre 
a primeira geração de séries temporais X e segunda geração de 
séries temporais MortM XI, €l, independente dos valores de p 
(Fig. 2.2). 

Finalmente, o mapeamento proposto M,, foi aplicado 
na segunda geração de séries temporais utilizando-se Q 
= 20 quantis para se obter a “segunda geração” de redes 
correspondentes. É notável que o mapeamento proposto é 
capaz de produzir a primeira geração de redes complexas g 
e a segunda geração de redes complexas M, (Mr (9)) com 
topologias similares para todos os valores de p (Fig. 2.2). 
As similaridades observadas entre a primeira e segunda 
gerações de séries temporais foram confirmadas por meio de 
suas funções de autocorrelação e os espectros de potência. 
Analogamente, as similaridades observadas entre a primeira e 
segunda gerações de redes complexas foram confirmadas por 
meio de suas distribuições da força de entrada, do peso das 
arestas e do comprimento do menor caminho [16]. 
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Mar Ma Mar 


1G séries temporais 1G redes complexas  2G séries temporais 2G redes complexas 


Figura 2.2: Avaliação qualitativa da fidedignidade do mapeamento 
proposto com base na primeira geração U G) e segunda geração 
(2G) de séries temporais e redes complexas. 


Fonte: Figura adaptada de [16] 


CONSIDERAÇÕES 


De modo geral, os resultados obtidos nesse trabalho 
indicam que o mapeamento proposto foi capaz de preservar 
informações estruturadas e não estruturadas nos domínios 
série temporal e rede complexa, sob sucessivas aplicações 
dos mapeamentos direto e inverso. É importante ressaltar que: 


* O mapeamento direto possui semelhança com a diná- 
mica simbólica, onde um sistema contínuo é discreti- 
zado em uma sequência de símbolos que representam 
o seu estado [61]. Em tal discretização, os vértices de- 
sempenham o papel de símbolos e a série simbólica 
é produzida a partir de um caminho particular sobre a 
rede associada; 
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esse mesmo mapeamento fornece uma aproximação 
única para a compressão de dados, em especial, de 
séries temporais reais que, na maioria dos casos, con- 
sistem de milhares de pontos. Neste caso, tal meca- 
nismo de armazenamento permite a compressão dos 
T pontos de uma série em uma matriz de transição de 
Markov de ordem Q; 


o procedimento numérico para a obtenção de uma rede 
complexa a partir de uma série temporal é simples e o 
custo computacional é da ordem de n(log n + 1), onde 
o custo associado ao reordenamento da série é da or- 
dem de n log n e o custo associado à identificação e 
distribuição dos valores da série em seus respectivos 
quantis é da ordem de n; 


no que diz respeito ao mapeamento inverso, a corres- 
pondência entre os vértices de uma rede e os quantis 
da série temporal associada, obtida pelo reordenamen- 
to da matriz W, possui custo computacional expressivo, 
sobretudo quando o número de vértices na rede cor- 
respondente é elevado; 


o procedimento numérico para a construção da série 
temporal a partir de uma rede complexa, conhecida a 
matriz W reordenada, é simples e o custo computacio- 
nal cresce linearmente com o número de quantis/vérti- 
ces Q. 
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CAPÍTULO 3 


FRACTALIDADE 


Nesse trabalho foi apresentada a generalização do 
mapeamento direto proposto por Campanharo et al. [16]. 
Nesse sentido, dada uma série temporal X, primeiramente seus 
Q quantis são identificados, e então, cada quantil q, é associado 
a um vértice n,€ N na rede (grafo de quantil) correspondente. 
Dois vértices n, e n, estarão conectados nessa rede com um 
arco (n, n, wi; ) E L sempre que dois valores x(?) e x(t + K) 
pertencerem aos quantis q,e q, respectivamente, para t= 1,2, 

»jTek=1,...,K <T. Cada peso na matriz de adjacência 
com pesos saiiEsBondente. denotada aqui por A,, é igual ao 
número de vezes que um um valor no quantil q, no tempo t é 
seguido por um valor no quantil q, no tempo t + k. A matriz de 
transição de Markov W, é obtida a partir da matriz de adjacência 
com pesos A4,, para 20 w;= 1 [15]. 

Nesse mesmo trabalho, foi também proposto um novo 
caracterizador de redes complexas, calculado a partir da matriz 
de transição de Markov associada e denominado comprimento 
do salto médio A(k): 

5 


1 a 
Ah) = 5 E bsxli) (3.1) 
onde s = S são os saltos de comprimento 6, (i, ) = li — jl 
ei j=1,..., Qsão os índices dos vértices, conforme definido 


por W,. 

É amplamente aceito na literatura que diversos fenômenos 
naturais apresentam elevada correlação e que o expoente de 
Hurst H [44] é um parâmetro indicativo da presença dessa 
correlação em séries temporais [58, 20]. Mais especificamente, 
o valor de H = 0,5 indica ausência de correlação (memória) 


Fractalidade 


em uma série temporal. A anti-correlação (anti-persistência) 
é caracterizada por um valor de H pertencente ao intervalo 
0,0 <H<0,5e a correlação (persistência) por um valor de H 
pertencente ao intervalo 0,5 < H'< 1,0. 

O coeficiente de Hurst pode ser estimado por meio 
de vários métodos, tais como, a Análise R/S, a Análise de 
Flutuação Destendenciada (em inglês, DFA — Detrended 
Fluctuation Analysis) e o Expoente de Hurst Generalizado [65]. 
Contudo, diversos fatores podem comprometer a estimativa 
de H, tais como, a não-estacionaridade intrínseca em uma 
série temporal real, o tamanho da série, a quantidade de ruído 
presente na mesma, além do esforço computacional gasto em 
tais estimativas. Desta forma, novos métodos para a estimativa 
do coeficiente de Hurst têm sido propostos [13]. 

O presente trabalho estabeleceu uma conexão entre as 
propriedades fractais de uma série temporal e a topologia de 
sua rede complexa correspondente. Mais especificamente, a 
generalização do mapeamento direto descrita anteriormente foi 
utilizada como um método alternativo para o cálculo do expoente 
de Hurst de uma série temporal. Para isso, esse mapeamento 
foi aplicado em séries temporais com propriedades fractais ou 
auto-similares [3], que por definição possuem seus espectros de 
potência caracterizados por uma lei de potência com inclinação 
dada por -f8 (em escala log-log), onde o expoente 6 é uma 
medida da intensidade da persistência (correlação) na série 
temporal associada (Fig. 3.1). Desta forma, observa-se —1 < 8 
<1teH=(8+ 1)/2 para ruídos fractais gaussianos (fGn) e 1 <B 
<3eH=(f6-1)/2 para movimentos brownianos (fBm). Quando 
B = O a série associada é um ruído branco (sem correlação). 
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Para cada valor de 8, foram geradas séries temporais 
com T = 10.000 pontos cada e, além disso, utilizados 
Q = 2(10.000): = 50 quantis (ou vértices) e k=1,2,..., 
1.000 em todas as simulações. Os resultados apresentados 
foram obtidos sob uma média de 100 realizações. As redes 
complexas associadas a tais séries apresentam estruturas 
topológicas que retratam as propriedades originais das séries 
temporais. O ruído branco, por exemplo, é mapeado em uma 
rede aleatória, com seus pesos distribuídos uniformemente 
sobre as linhas e colunas de W,. À medida que as séries 
passam a ser correlacionadas, W, deixa de ser uma matriz 
anti-diagonalmente dominante e passa a ser diagonalmente 
dominante. 

A Figura 3.2 apresenta os valores de A(k) versus k (em 
escala log-log) para diferentes valores de &. Para cada valor de 
B, observa-se uma lei de potência com mais que duas décadas 
de extensão. À medida que os valores de £ e as correlações 
nas séries temporais correspondentes aumentam, a distância 
entre pares de vértices n, and n, aumenta, e desta forma, o 
valor de A diminui. As inclinações de tais curvas podem ser 
utilizadas na estimativa do expoente de Hurst, Ha A Figura 
3.3 apresenta uma comparação entre o valor aproximado do 
expoente de Hurst, Ela e seu valor exato H, ambos associados 
as séries em estudo. As regiões com escalas lineares na 
Figura 3.2 foram utilizadas para a estimativa do expoente de 
Hurst He. por meio de uma regressão linear. As barras de erro 
representam intervalos de confiança de 95%. Observa-se uma 
forte correlação entre os valores de a e H. 
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Figura 3.1: Exemplos de séries temporais auto-similares obtidas 
para T = 1.000 e valores de P iguais a 1,0; 0,5; 0,0;0,5; 1,0 e 2,0. 
Observa-se que à medida que o valor de B aumenta as séries 
temporais correspondentes se tornam mais persistentes, ou seja, 
seus valores adjacentes se tornam mais correlacionados. 
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Figura 3.2: Comprimento do salto médio (em escala log-log) versus 
k para diferentes valores de /, obtido de 100 diferentes caminhos 
aleatórios nas redes complexas correspondentes. 


Fonte: [15]. 
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Figura 3.3: Comparação entre Ea e os valores dos coeficientes de 
Hurst corres- pondentes. Observa-se uma correlação elevada entre 
He A. 


Fonte: [15]. 
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CONSIDERAÇÕES 


O número de quantis Q, que define o nível de partição 
da série temporal em estudo e sua seleção envolve um 
conflito entre a perda de informação e o custo compu- 
tacional para o cálculo de Ria: Para o caso binário, Q 
=2, a série temporal será mapeada em uma rede com 
dois vértices, e, desta forma, o mapeamento não será 
capaz de capturar detalhes da dinâmica da série tem- 
poral; 


A escolha de valores superiores de Q permite um me- 
lhor mapeamento da dinâmica da série em estudo. 
Contudo, requer séries temporais mais longas para 
que as probabilidades de transição convirjam apropria- 
damente, já que um número maior de vértices implica 
um menor número de saltos entre dois vértices e, con- 
sequentemente, um aumento do esforço computacio- 
nal para o cálculo de H; 


no limite, quando Q for igual a T não haverá perda de 
informação, desde que T seja suficientemente grande 
para que o valor de He convirja. Contudo, nesse tra- 
balho observa-se que valores reduzidos de Q são sufi- 
cientes para a estimativa de H; 


a medida que Q aumenta, maior será o número de sal- 
tos e, consequentemente, maior será o esforço compu- 


tacional para o cálculo de A. ; 


o custo computacional para a estimativa de H cresce 
linearmente com Q. 
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CAPÍTULO 4 


EPILEPSIA 


A epilepsia é definida como uma desordem do cérebro, 
sendo caracterizada por uma predisposição à geração crises 
epilépticas ou convulsões em indivíduos. Do ponto de vista 
clínico, duas categorias de crises epilépticas são estabelecidas: 
parcial e generalizada. As crises parciais ou focais originam- 
se em um pequeno grupo de neurônios onde está localizado 
o foco da crise, podendo ou não apresentar sintomatologia 
específica e apresentam atividade eletroencefalográfica restrita 
a determinada região cerebral de um único hemisfério. Por 
sua vez, as crises generalizadas ocorrem de maneira difusa 
por todo o cérebro, ou seja, envolvem os dois hemisférios 
simultaneamente [75]. 

Aproximadamente 70% dos pacientes com epilepsia focal 
ou difusa têm os sintomas da doença controlados de maneira 
eficaz com drogas anti-epilépticas. Contudo, os 30% restantes 
se mostram resistentes ao tratamento medicamentoso e, para 
grande parte desses indivíduos, a alternativa é o procedimento 
cirúrgico de ressecção. Tal procedimento consiste em 
remover a zona epileptogênica do paciente doente, ou seja, 
a região neuronal responsável por gerar as crises epilépticas. 
Atualmente, a detecção com exatidão de tal região por meio de 
técnicas não-invasivas, com o uso de dados de EEG, vídeo-EEG, 
magnetoencefalografia, tomografia por emissão de pósitrons, 
têm sido propostas no meio científico [37, 68]. Contudo, como 
na maioria dos casos os resultados permanecem divergentes 
e a sua localização imprecisa, faz-se necessária a proposição 
de novas metodologias para o tratamento de pacientes com a 
doença. 
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Recentemente, diversos métodos têm sido propostos para 
a análise de sinais de EEG de pacientes com epilepsia baseados 
em Transformada Rápida de Fourier [80, 4, 53], Transformada 
Wavelet [39, 62, 30], Análise Espectral [93, 94, 99], Distribuições 
Tempo-Frequência [83, 73] e Modelos Auto-Regressivos [105, 
23]. A Transformada Rápida de Fourier é o método com menor 
custo computacional, contudo, é o menos eficiente na análise 
de sinais curtos, não-estacionários e contaminados por ruído 
[5]. A Transformada Wavelet foi criada para a identificação de 
padrõesirregulares emsinaisreais, contudo, aescolha da melhor 
ondeleta-mãe para a decomposição de sinais não-estacionários 
é ainda um tema controverso [31]. A Análise Espectral oferece 
bom desempenho no estudo de sinais contaminados por ruído, 
porém pode produzir resultados com uma baixa acurácia 
estatística [5]. As Distribuições Tempo-Frequência permitem a 
análise de sinais longos, contudo necessitam de uma elevada 
frequência de amostragem dos mesmos [5]. Finalmente, os 
Modelos Auto-Regressivos são eficientes na análise de sinais 
curtos, mas possuem elevado custo computacional [5]. Com 
base nas deficiências apresentadas pelos métodos citados, 
faz-se necessária a proposição de novos métodos de análise 
de dados de EEG para o estudo da epilepsia. 
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4.1 DISTINÇÃO ENTRE INDIVÍDUOS SAUDÁVEIS E 


COM EPILEPSIA 


Neste trabalho, foi proposta uma aproximação alternativa 
para o cálculo de A(k) [13], definida como: 


A(k) (PWj), (4.1) 


= Er 
Q 

onde W; é a matriz transposta de W,, P é uma matriz Q 
x Q cujos elementos são definidos como DP; = li-jletréa 
operação traço de uma matriz. 

Além disso, o mapeamento GQ generalizado foi utilizado 
na diferenciação de indivíduos sadios e com a epilepsia a 
partir de dados fisiológicos de EEG, fornecidos pelo Programa 
de Epilepsia da Universidade de Bonn [2]. Esse programa 
disponibiliza dados de EEG medidos na superfície do couro 
cabeludo de indivíduos (A) sadios com olhos fechados e (B) 
sadios com olhos abertos. Estão disponíveis ainda EEG's 
intracranianos de pacientes com epilepsia (C) dentro e (D) fora 
da área geradora de convulsão, bem como (E) com epilepsia e 
com episódios de convulsão (crises epilépticas). Essa base de 
dados disponibiliza sinais de EEG de 100 pacientes em cada 
grupo, amostrados à 256 Hz. Cada sinal contém 4.096 pontos e 
não há especificação de qual canal foi utilizado para a geração 
desses sinais. 

A Figura 4.1 apresenta exemplos de sinais associados aos 
grupos A, B, C, De E. Sinais de EEG de pacientes sadios com 
olhos fechados (Fig. 4.1 (B)) apresentam um ritmo fisiológico 
predominante, conhecido como “ritmo alfa” com frequências 
entre 8 a 13 Hz. Contudo, o mesmo comportamento não é 
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observado em pacientes sadios com olhos abertos (Fig. 4.1 
(A)). Em períodos livres de convulsão, o sinal de EEG medido 
na área geradora de convulsão (Fig. 4.1 (D)) é frequentemente 
caracterizado por ocorrências intermitentes de atividades 
epileptiformes (i.e. padrões periódicos e rítmicos de atividade 
cerebral). Tais atividades ocorrem em menor número em 
regiões distantes da área epiléptica (Fig. 4.1 (C)). O sinal de 
EEG de um paciente com epilepsia e com crises epilépticas 
(Fig. 4.1 (E)) é aproximadamente periódico devido à sincronia 
de grande parte dos neurônios durante a convulsão na área 
medida [38]. 


1000 | | 


| | | | | 1 
0 1000 2000 3000 4000 
Figura 4.1: Sinais de EEG de pacientes associados a cada um dos 
grupos em estudo; de cima para baixo: A (sadio, olhos abertos), B 


(sadio, olhos fechados), C (com epilepsia, zona oposta), D (com 
epilepsia, zona epiléptica) and E (com epilepsia e convulsão). 


Fonte: Figura adaptada de [14]. 
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Tomando-se Q = 30, T=4.096 e k=1,2,..., 100, 
500 sinais foram mapeados em 50.000 redes complexas, ou 
equivalentemente, em 50.000 matrizes de transição de Markov. 
Para cada grupo e um dado valor de k, tomou-se a mediana 
sobre todas as matrizes e, desta forma, foram obtidas matrizes 
de transição de Markov de medianas. Em seguida, A(k) versus 
kfoi calculado para todos os grupos em estudo (Fig. 4.2). Pôde- 
se observar que as curvas associadas aos pacientes sadios (A 
e B) e com epilepsia (C e D) formam dois grupos distintos com 
separação máxima de aproximadamente k. =4. Para k>30, 
as correlações entre as redes correspondentes desaparecem e 
todas as curvas se fundem em uma só. 

A Figura 4.3 apresenta os boxplots de A(k) para k.. =4, 
calculados sobre 100 segmentos, para os grupos A, B, C, D 
e E. Observou-se que o mapeamento utilizado permitiu uma 
distinção robusta entre pacientes sadios e com epilepsia. 
Comparando os grupos B (sadio, olhos fechados) e C (com 
epilepsia, zona oposta), existe uma diferença significativa entre 
as medianas correspondentes para um intervalo de confiança 
de 95% ([4, 2989, 4, 7790]) e um p-valor inferior a 0,05. Para 
os grupos A (sadio, olhos abertos) e D (com epilepsia, zona 
epiléptica), existe também uma diferença significativa entre as 
medianas correspondentes para um intervalo de confiança de 
95% ([2, 6689, 3, 2625]) e um p-valor inferior a 0,05. 


Epilepsia 


24 


12 


10 


4 «— Grupo A 
-— Grupo B| | 
—— Grupo C 
2 —— Grupo D| + 
—— Grupo E 
j j j LILI | l l j RR A | j j l RR A O 
0,1 10 100 


Figura 4.2: A(K) versus k para os grupos: A (sadio, olhos abertos), 
B (sadio, olhos fechados), C (com epilepsia, zona oposta), D (com 
epilepsia, zona epiléptica) and E (com epilepsia e convulsão). 


Fonte: Figura adaptada de [14]. 


A Figura 4.4 mostra as matrizes de transição de medianas 
para k, = 4. Observou-se que sinais de EEG de indivíduos em 
diferentes grupos foram mapeados em redes complexas com 
topologias distintas. Para pacientes sadios do grupo B (Fig. 4.4 
(b)), os pesos estão distribuídos de maneira difusa nas linhas 
e colunas de W, quando comparados com os obtidos para os 
pacientes sadios do grupo A (Fig. 4.4 (a)). Para os pacientes 
doentes do grupo D (Fig. 4.4 (d)), os maiores pesos de W, 
estão concentrados nos quantis periféricos devido os padrões 
de alta amplitude encontrados nas séries correspondentes. 
Embora aos gráficos nas Figuras 4.4 (c) e (d) sejam muito 
parecidos, as ocorrências intermitentes de atividades 
epileptiformes encontradas no grupo D (quando comparadas ao 
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grupo C) contribuem para a geração de matrizes de transição 
com pesos menores. Finalmente, as altas amplitudes e os 
padrões aproximadamente periódicos encontrados no grupo 
E são mapeados em matrizes de transição com seus pesos 
distribuídos ao longo da diagonal secundária (Fig. 4.4 (e)). 


1 2 T T T T 
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| | | | | 
Grupo A Grupo B Grupo C Grupo D Grupo E 


Figura 4.3: Boxplots de A(k) calculado sobre 100 segmentos cada, 

para Os grupos: A (sadio, olhos abertos), B (sadio, olhos fechados), 

C (com epilepsia, zona oposta), D (com epilepsia, zona epiléptica) 
and E (com epilepsia e convulsão) e k = 4. 


Fonte: Figura adaptada de [14]. 


Em resumo, as análises realizadas mostraram que 
o mapeamento proposto por Campanharo et al. [16], e 
posteriormente modificado por Campanharo et al. [15], foi capaz 
não só de diferenciar pacientes sadios de pacientes doentes, 
mas também de distinguir os diferentes padrões (estágios) de 
uma convulsão, tais como o pré-ictal (alterações nos dados de 
EEG antes de uma convulsão) e ictal (alterações nos dados 
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de EEG durante uma convulsão). Tais resultados mostram a 
eficácia do mapeamento utilizado na diferenciação de dados 
fisiológicos e seu potencial para a identificação e previsão de 
crises epilépticas. 


4.2 IDENTIFICAÇÃO DE CRISES EPILÉPTICAS 


Uma crise epiléptica é definida como uma ocorrência 
transitória de sinais e sintomas, devido à atividade anormal 
do cérebro de forma excessiva e síncrona [28]. Tal atividade 
ocorre de maneira quase imprevisível e com tempos de início 
e término bem definidos, demarcados pela mudança de estado 
do indivíduo ou pela mudança nos sinais fisiológicos de EEG 
[27]. Uma crise epiléptica pode afetar a capacidade motora, 
sensorial e autonômica de um indivíduo, bem como o seu 
estado de consciência emocional e até comportamental [27]. 
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Sua identificação pode auxiliar na previsão de convulsões em 
pacientes com epilepsia [18]. 
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Figura 4.4: Matrizes de transição para os grupos A (sadio, olhos 
abertos), B (sadio, olhos fechados), C (com epilepsia, zona oposta), 
D (com epilepsia, zona epiléptica), E (com epilepsia, com convulsão) 

ek =4. 
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Fonte: Figura adaptada de [14]. 


A identificação das crises epilépticas em sinais de EEG, 
que muitas vezes é realizada por um neurofisiologista treinado 
via inspeção visual, pode ser desafiadora por diversas razões, 
tais como, interpretações errôneas, contaminação dos sinais 
por artefatos provenientes de movimentos corporais, suor do 
paciente, falhas técnicas provenientes do mau posicionamento 
dos eletrodos no couro cabeludo, flutuações de impedância, 
entre outros [90, 88]. Desta forma, faz-se necessária a 
proposição de métodos eficazes para a identificação automática 
de tais crises [22]. 
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Conforme descrito anteriormente, a discretização de 
uma série temporal X, com base nos quantis de seus valores, 
particiona os seus T pontos em Q quantis de mesmo tamanho, 
cada qual com T/Q pontos. Como as crises epilépticas estão 
frequentemente associadas a elevadas amplitudes em um 
sinal de EEG, sua discretização por quantis pode agrupar 
em um mesmo quantil valores de alta e baixa amplitude, 
comprometendo a identificação de tais crises. Nesse sentido, 
o mapeamento proposto por Campanharo et al. [16, 15] 
foi ligeiramente modificado e a discretização de X foi feita 
utilizando o conceito de bins [91]. Nesse sentido, dada uma 
série temporal X com T pontos, divide-se X em B bins. Cada 
bin b ('=1,2,..., B) é associado a um vértice n, e N na rede 
g correspondente. Dois vértices n,e n, são conectados na rede 
com uma aresta (n, n, 7) € L, onde o peso W, de cada aresta 
é dado pelo número de vezes que um dado ponto x, no bin b é 
seguido por um ponto x, no bin b. 

Para a diferenciação de períodos seme comcrises epilépticas, 
um dado sinal em estudo é dividido em s segmentos adjacentes e o 
mapeamento em bins é aplicado em cada um desses segmentos. 
Cada segmento é mapeado em kredes complexas com no máximo 
Qvértices cada (Fig. 4.5). Com base nos valores da bipartividade 
(B) e do índice Estrada (EE) de todas as redes resultantes e 
da técnica de validação cruzada [11], realiza-se a classificação 
de períodos com e sem crises epilépticas, escolhendo-se para 
cada segmento o valor de k que maximiza a diferenciação entre 
períodos sem e com crises. 

O mapeamento em bins foi utilizado na detecção das crises 
epilépticas, a partir de uma base de dados de sinais de EEG 
construída pelo Hospital Infantil de Boston [85] e disponibilizada 
gratuitamente pelo Physionet [1]. Tal base é constituída de 
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oito pacientes pediátricos com epilepsia (menores que 18 
anos) mantidos sob medicações antiepilépticas. Cada sinal 
possui uma hora de duração, apresenta exatamente uma crise 
epiléptica e foi coletado a uma taxa de amostragem de 256 Hz, 
conforme o sistema internacional 10-20 de posicionamento de 
eletrodos [67]. 

Os sinais em estudo possuem T = 921.600 pontos cada 
e foram divididos em 230 segmentos adjacentes com 4.000 
pontos cada. Cada segmento foi mapeado em redes complexas 
com k=1,2,..., 10, totalizando para cada um deles 10 redes 
complexas com no máximo B = 2 « (4.000)'º = 30 vértices 
cada. A Tabela 4.1 apresenta a duração da crise epiléptica 
sofrida por cada paciente e o número de redes associadas às 
crises. A Tabela 4.2 apresenta os valores de Acu, Sen e Esp 
com base nos valores da bipartividade e do índice Estrada para 
cada um dos pacientes. Em cada caso, foi escolhido o canal 
que apresentou a melhor diferenciação entre períodos sem ou 
com crises epilépticas. Os valores médios de Acu, Sen e Esp, 
dados respectivamente por 99,1%, 93,2% e 99,1%, atestam 
que a metodologia proposta se mostrou altamente eficaz na 
identificação das crises epilépticas. 
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Figura 4.5: Ilustração da aplicação do mapeamento em bins em 
um sinal de EEG com T = 7.500 pontos, k = 1, 2,3, particionado 
em s = 5 segmentos. Cada segmento possui T = 1.500 pontos e foi 
mapeado em três redes complexas com no máximo B 2 (1.500)'º 
= 23 vértices cada. A cor azul corresponde aos períodos livres do 
evento (crise epiléptica) e a cor vermelha corresponde ao período do 
evento. 


Fonte: Figura adaptada de [91]. 
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CONSIDERAÇÕES 


Os valores de A obtidos pelas Equações 3.1 e 4.1 são 
os mesmos para S » º. Na prática, considerando S 
suficientemente elevado, a convergência do valor de 
A é garantida com um esforço computacional reduzido 
quando a segunda aproximação for utilizada; 


Os sinais de EEG fornecidos pela Universidade de 
Bonn possuem algumas limitações, tais como, o tempo 
de medida reduzido (16 segundos), a utilização de ape- 
nas um eletrodo na obtenção dos dados e o desconhe- 
cimento do eletrodo utilizado. Além disso, a base de 
dados em questão carece de exames de imagens e da- 
dos clínicos dos pacientes. Tais limitações impediram 
explorar aspectos adicionais do tema em estudo, tais 
como, a diferenciação entre períodos não-convulsivos, 
pré-convulsivos e convulsivos de um dado paciente; 


Tabela 4.1: Informações sobre os pacientes em estudo, as crises 
epilépticas e as redes produzidas pelos sinais de cada um dos 


pacientes. 
Paciente Gênero Idade Duração (s) Nº de redes 
associadas 
1 F 7 96 7 
2 F 14 69 6 
3 F 11 90 6 
4 M 3 171 12 
5 E 9 41 4 
6 F 12 90 6 
7 E 19 78 6 
8 F 9 58 5 
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Tabela 4.2: Canais que apresentaram os melhores valores de Acu, 


Sene Esp para cada um dos pacientes em estudo. 


Paciente Melhor (es) Acu Sen Esp 
Canal (is) 
1 F3-C3; F4-C4 1,000 1,000 1,000 
2 CZ-PZ 0,987  0,8333 0,991 
3 F3-C3; F7-T7 0,991 1,000 0,991 
4 FZ-CZ 0,952 0,750 0,963 
5 C4-P4 0,995 0,750 1,000 
6 C3-P3 0,965 0,666 0,973 
Fá C3-P3; F3-C3; FP1-F3; 0,991 1,000 0,991 
FP2-F4: P3-01; P7-01; 
P8-02 
8 FZ-CZ 0,995 1,000 0,995 


Nesse sentido, a base de dados do Physionet, que 
contém sinais de EEG de alta resolução temporal e in- 
formações sobre a duração das crises, foi utilizada com 
êxito na diferenciação de períodos sem e com crises 
epilépticas. Consequentemente, tais dados permitem o 
estudo da previsão de convulsões em pacientes com 
epilepsia - um tema de pesquisa a ser explorado futu- 


ramente. 
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CAPÍTULO 5 


ALZHEIMER 


A doença de Alzheimer pode ser entendida como uma 
demência degenerativa e progressiva do Sistema Nervoso 
Central. Tal doença é caracterizada, principalmente, pela 
deterioração intelectual acelerada, perda de memória e 
desorientação no tempo e no espaço [12]. A DA é a principal 
demência entre os idosos com mais de 65 anos e afeta, 
aproximadamente, 25 milhões de indivíduos em todo o mundo 
[76, 12]. De causa desconhecida, a doença se desenvolve 
lentamente, atinge inicialmente o hipocampo, se espalha para 
as regiões parietal, temporal lateral e frontal, e eventualmente 
afeta todas as regiões do cérebro [29, 45]. Como a DA é 
irreversível, seu diagnóstico precoce pode contribuir para a 
diminuição da progressão da doença. 

Atualmente, o diagnóstico preciso da DA pode ser feito 
apenas por meio de um exame do tecido cerebral, obtido por 
biópsia ou necrópsia. Como somente após a morte do paciente 
pode-se ter a certeza que o mesmo tinha a doença, seu diag- 
nóstico aproximado é feito excluindo-se outras causas de 
demência pelo histórico clínico do paciente, tais como, doenças 
preexistentes, cirurgias, uso de medicações, depressão e perda 
de memória associada à idade. Em paralelo, estudos têm 
sido desenvolvidos para a investigação da DA com base em 
informações da atividade cerebral de pacientes com a doença. O 
EEG é conhecido como um biomarcador neurofisiológico da DA e 
apresenta como grandes vantagens um baixo custo, uma elevada 
resolução temporal e uma ampla disponibilidade. O estudo da DA 
por meio de dados de EEG tem sido realizado a partir de diversos 
métodos, tais como, Transformada Rápida de Fourier (TRF) [55, 
26], Transformada Wavelet (TW) [77, 102, 36, 25], Reconstrução 
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do Espaço de Fases (REF) [51, 89, 56], Modelos Espectrais (ME) 
[93, 94], Distribuições Tempo-Frequência (DTF) [83] e Modelos 
Auto-Regressivos (MAR) [105], que partem das premissas de 
estacionaridade, alta resolução temporal e/ou baixa interferência 
de ruído. 

Nesse trabalho, o mapeamento GQ generalizado foi 
aplicado com o objetivo de: i) diferenciar idosos sadios de 
pacientes com a DA, ii) detectar as regiões do cérebro mais 
afetadas pela doença e iii) identificar seus estágios nos pacientes 
em estudo [78, 79]. Para isso, foi utilizada uma base de dados 
de EEG fornecida gratuitamente pelo Departamento de Física 
da Universidade do Estado da Flórida (EUA). Tal base de dados 
é constituída de 19 canais de EEG de 24 idosos saudáveis 
(grupo de controle), sem históricos de distúrbios neurológicos 
ou psiquiátricos, com idade média de 71 anos (variação entre 
61 e 83 anos). Essa base de dados compreende, ainda, 160 
pacientes diagnosticados com a DA pelo Instituto Nacional de 
Distúrbios Neurológicos, Desordens Comunicativas e Acidente 
Vascular Encefálico (NINCDS-ADRDA), com idade média de 74 
anos (variação entre 53 e 85 anos). Os dados foram coletados 
em pacientes com olhos abertos e fechados. O período de 
medida foi de oito segundos, a uma taxa de amostragem de 128 
Hz, totalizando 1.024 pontos para cada um dos 184 indivíduos 
e para cada um dos 19 canais (Fig. 5.1). 
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Figura 5.1: Exemplos de séries de EEG para cada um dos conjuntos 
em estudo (canal F, - lobo frontal). De cima para baixo: A (paciente 
saudável, olhos abertos), B (paciente saudável, olhos fechados), C 
(paciente com a DA, olhos abertos) e D (paciente com a DA, olhos 

fechados). 


Fonte: Figura adaptada de [79]. 


5.1 DISTINÇÃO ENTRE ENVELHECIMENTO E A DA 


Foram utilizados sinais de EEGs relativos aos canais F., F, 
e P, pelo fato de F, e F, estarem mais próximos do hipocampo - 
que corresponde à primeira região do cérebro a ser afetada pela 
DA e P, ser o canal próximo do lobo parietal - que constitui um 
canal selecionado aleatoriamente. Como cada sinal possui 7 = 
1.024 pontos, foram utilizados Q = 2(1.024)3 = 20 quantis (ou 
vértices) e k=1,2,...,25 em todas as simulações. Foi ainda 
utilizado o mesmo número de pacientes em cada um dos quatro 
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grupos e, desta forma, 48 sinais de EEG foram mapeados em 
1.200 grafos de quantis (ou 1.200 matrizes de adjacência A). 
Portanto, foram obtidas 1.200 matrizes de transição de Markov 
W, com CY? = 400 elementos cada. 

Para os conjuntos A, B, Ce De para os canais F., F, 
e P, foram calculados o coeficiente de agrupamento C, a 
modularidade M, o comprimento do salto médio A e o grau de 
intermediação B versus k, respectivamente. Observou-se, em 
todos os casos, que as curvas associadas a pacientes sadios 
(Ae B) e com a DA (C e D) formam dois grupos distintos, 
independentemente da condição “olhos abertos” e “olhos 
fechados”, com máxima separação para um dado valor de 
k, denotado como k (Tab. 5.1). Comportamentos similares 
podem ser observados para os demais canais e encontrados 
em [79]. 
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Figura 5.2: C(k), M(k), A(k) e B(k) versus k (canal F, - lobo frontal) 
com T=1.024, Q=20e k=1,2,..., 25 para os conjuntos A 
(pacientes saudáveis, olhos abertos), B (pacientes saudáveis, olhos 
fechados), C (pacientes doentes, olhos abertos) e D (pacientes 
doentes, olhos fechados). 


Fonte: Figura adaptada de [79]. 


A Figura 5.3 exibe os boxplots de C, M, Ae B associados 
aos valores de k apresentados na Tabela 5.1, para os conjuntos 
A, B,Ce De ao canal F., respectivamente. Os boxplots para os 
demais canais podem ser encontrados em [79]. 
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Tabela 5.1: Valores de K, escolhidos para cada canal e cada 
classificador de rede em estudo. 


Fonte: Tabela adaptada de [78]. 


CM a B 
F. 2 6 10º 6 


f 


Ft BB. B 


8 


Po Ja 33. N. 1% 


Z 


Observou-se que o mapeamento utilizado permitiu uma 
discriminação entre os idosos saudáveis (A e B) e pacientes 
com a DA (C e D), independentemente do caracterizador de 
rede e do canal escolhidos. Mais especificamente, observou- 
se que pacientes em diferentes condições de saúde possuíam 
medianas distintas, dadas por 0,2077; 0,2033; 0,2248 e 0,2232 
para C; 0,0605; 0,0728; 0,0145 e 0,0072 para M; 4,8010; 
4,2190; 6,6790 e 6,6510 para A e 0,0111; 0,0129; 0,0061 e 
0,0054 para B, respectivamente. Além disso, com base no teste 
estatístico ANOVA, observou-se a existência de uma diferença 
significativa entre as medianas correspondentes para um 
intervalo de confiança (IC) de 95% e um p-valor inferior a 0,05 
(Tab. 5.2). A diferença encontrada entre os grupos de idosos 
sadios e com a DA foi quantificada pelo cálculo da área sob 
a curva ROC (A,oo) (Tab. 5.3). Os valores obtidos pelo teste 
ANOVA e pela área sob a curva ROC para os demais canais 
em estudo podem ser encontrados em [79]. 

Por fim, os valores de C, M, A e B associados aos 48 
indivíduos em estudo, em conjunto com a técnica de validação 
cruzada (K = 10), foram utilizados para avaliar o desempenho 
do mapeamento em estudo na classificação binária desses 
indivíduos para as condições “saudável” ou “com a DA” [60, 
26]. Os valores de acurácia (100%), sensibilidade (100%) e 
especificidade (100%) obtidos mostram que o mapeamento 
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GQ foi eficaz na diferenciação e classificação de indivíduos em 
diferentes condições patológicas. 


Tabela 5.2: Comparação estatística entre as medianas de C, M, A e 

Bparak .=9,6€e10€ 6, (canal F. - lobo frontal), respectivamente, 

entre os conjuntos A (saudáveis, olhos abertos), B (saudáveis, olhos 

fechados), C (doentes, olhos abertos) e D (doentes, olhos fechados), 
com base no teste estatístico ANOVA. 


Fonte: Tabela adaptada de [79]. 
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Figura 5.3: Boxplots de C, M, Ae B, (canal F. - lobo frontal) para 
os conjuntos A (saudáveis, olhos abertos), B (saudáveis, olhos 
fechados), C (doentes, olhos abertos) e D (doentes, olhos fechados) 
e Kx=9,6, 10e 6, respectivamente. 


Fonte: Figura adaptada de [79]. 
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Tabela 5.3: Áreas sob as curvas ROC de C, M, Ae Bparak =9,6, 

10 e 6 (canal F, - lobo frontal) entre os conjuntos A (saudáveis, olhos 

abertos), B (saudáveis, olhos fechados), C (doentes, olhos abertos) 
e D (doentes, olhos fechados). 


Fonte: Tabela adaptada de [79]. 


C M A B 
AC) 0,8472 0,8785 0,9653 0,8368 
BD) 1,0000 1,0000 1,0000 0,9965 
AD) 0,9375 0,9236 0,9653 0,9167 
BC) 0,9167 1,0000 1,0000 0,9792 


5.2 DESEMPENHO DOS CARACTERIZADORES COM 


BASE NOS CANAIS DE EEG 


A partir dos 19 canais de EEG em estudo, foi realizada 
uma análise do desempenho dos caracterizadores de redes 
complexas utilizados na distinção entre idosos sadios e com a 
DA. Nesse sentido, considerando-se todos os grupos e canais, 
foram calculados os valores de C, M, A e B versus k. Para 
um dado canal e um dado caracterizador, k. foi escolhido de 
maneira a obter a separação máxima entre as curvas de idosos 
saudáveis (conjuntos A ou B) e pacientes com DA (conjuntos C 
ou D) e amédia de A, denotada por Á,.,; foi calculada através 
da combinação entre todos os conjuntos. Desta forma, foi 
possível identificar o canal de EEG que obteve a maior precisão 
na distinção de pacientes saudáveis e pacientes com a DA (Fig. 
5.4). De forma geral, o mapeamento GQ e, consequentemente, 
todos os caracterizadores em estudo mostraram-se eficazes 
na diferenciação. O comprimento do salto médio (A) mostrou- 
se o caracterizador topológico mais eficiente, possuindo 
valores da A,.c iguais a 1 em todas as análises. Observa-se 
ainda que, independente do caracterizador utilizado, o canal P, 
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apresentou o melhor desempenho para a diferenciação. Isso 
se deve, possivelmente, ao fato da base de dados utilizada ser 
composta por pacientes no estágio avançado da DA. 
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Figura 5.4: Desempenho dos caracterizadores C, M, Ae B, a partir 
dos valores de A oc e dos 19 canais de EEG, na diferenciação de 
idosos sadios e com a DA. Com base nas combinações entre os 
conjuntos Ae C,BeD,AeDeBec, foi calculado a média dos 
valores de À, .c que assume valores entre 0,7143 e 1,0000. 


Fonte: Figura adaptada de [79]. 
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5.3 INVESTIGAÇÃO DOS POSSÍVEIS ESTÁGIOS DA DA 


É conhecido na literatura que o estágio inicial da DA é 
caracterizado pelo aumento da atividade das ondas teta e 
pela diminuição da atividade das ondas beta, seguida pela 
diminuição da atividade das ondas alfa [49, 6]. À medida que 
a doença avança, observa-se cada vez mais o aumento da 
atividade da onda delta [49]. Com o objetivo de detectar as ondas 
dominantes nos sinais de EEG em estudo e, desta forma, inferir 
os estágios da DA em que se encontram os pacientes doentes, 
tais dados foram decompostos em bandas de frequência (delta, 
teta, alfa e beta) com o uso da transformada Wavelet [19]. Uma 
vez que a condição “olhos abertos” contribui para o aumento 
da atividade das ondas alfa [40], pacientes pertencentes aos 
grupos B e D foram utilizados nas análises. Além disso, o canal 
P. foi escolhido para a decomposição, uma vez que o mesmo 
apresentou o melhor desempenho na distinção entre idosos 
saudáveis e doentes. 

O mapeamento GQ foi aplicado para as séries 
relacionadas às ondas beta (13-30 Hz), alfa (8-13 Hz), teta 
(4-8 Hz) e delta (1-4 Hz). Analogamente às séries originais, 
cada série decomposta possui T = 1.024 pontos e, desta 
forma, foram utilizados Q = 20 quantise k=1,2,...,2b em 
todas as análises subsequentes. Desta forma, 4 x 24 x 25 
séries temporais foram mapeadas em 2.400 redes complexas 
(ou 2.400 matrizes de adjacência) e obtidas 2.400 matrizes de 
transição de Markov com Q*= 400 elementos cada. Em seguida, 
para cada grupo e onda e um dado valor de k, foi calculada a 
matriz de transição de Markov de medianas. Para ambos os 
grupos e bandas de frequência foi calculado o comprimento 
do salto médio, uma vez que o mesmo apresentou o melhor 
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desempenho na discriminação dos grupos em estudo (Fig. 
2.5): 

Observa-se que, independentemente do valor de k, as 
curvas associadas aos pacientes sadios (grupo B) e com a 
DA (grupo D) são similares para as ondas teta, alfa e beta. 
Por outro lado, existe uma diferença significativa (intervalo de 
confiança (IC) de 95% e p-valor inferior a 0,05) entre as curvas 
associadas aos grupos B e D para a onda delta (Tab. 5.4). Esse 
resultado corrobora a premissa de que todos os pacientes em 
estudo apresentavam sintomas da doença e poderiam tê-la em 
seu estágio avançado. 


Tabela 5.4: Comparação estatística entre as médias amostrais 
associadas ao caracterizador À para os grupos B e D. 


Fonte: Tabela adaptada de [79]. 


Ondas Delta Teta Alfa Beta 
Cap [0,4701: [-1,6578; [-1,2420; [-0,8414; 
2,3893] 1,7063] 1,1546] 1,1609] 
p-valor 0,0045 0,9767 0,9418 0,7497 


Em resumo, a combinação entre o mapeamento GQ, os 
caracterizadores topológicos de redes complexas e o método 
de validação cruzada k-fold apresentou um desempenho 
excelente para o problema de classificação binária de 
indivíduos em diferentes condições (saudáveis versus 
doentes). Espacialmente, os eletrodos que melhor capturaram 
tais diferenças foram aqueles próximos à região esquerda dos 
lobos temporal-parietal. Esse resultado está em concordância 
com o entendimento atual da progressão da DA. Na maior parte 
dos casos, a doença afeta principalmente a região esquerda do 
lóbulo temporal-hipocampal, que é a responsável pela memória 
verbal e, aparentemente, o hemisfério mais vulnerável [64]. 
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10.00 ; 7 - 10.00 : 


25 


Figura 5.5: A versus k (canal P,), T= 1.024, Q=20ek=1,2...,25 


para as ondas beta (A, ..), alfa (A,,.), delta (A,,) e teta (A...) para os 


pacientes dos grupos B e D. 
Fonte: Figura adaptada de [79]. 


CONSIDERAÇÕES 


* Ossinais de EEG fornecidos pela Universidade da Fló- 
rida, compartilhados mediante solicitação, possuem al- 
gumas limitações, tais como, o tempo de medida dos 
sinais de EEG reduzido (8 segundos), a ausência de 
exames de imagens e de dados clínicos dos pacien- 
tes. Tais limitações impedem o diagnóstico preciso do 
estágio em que se encontravam os pacientes em estu- 
do com a DA, já que o diagnóstico é inconclusivo com 
base apenas em sinais de EEG; 
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* Nesse sentido, convém destacar a escassez de bases 
de dados de idosos em diferentes estágios do Alzhei- 
mer em sites de domínio público, sobretudo contendo 
dados de resolução temporal, espacial e clínicos. 
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PERSPECTIVAS 


Perspectivas de pesquisas futuras incluem: 


a aplicação da metodologia desenvolvida em outras 
bases de dados de idosos com o Alzheimer, com o ob- 
jetivo de avaliar a replicabilidade dos resultados encon- 
trados; 


a proposição de um mapeamento 2D baseado no con- 
ceito de quantis, capaz de mapear imagens em redes 
complexas. Trata-se de uma metodologia promissora e 
inédita que permitirá identificar estruturas em imagens 
médicas, tais como, a presença de anormalidades em 
órgãos que podem representar uma má-formação ou, 
até mesmo, a presença de tumores; 


o desenvolvimento de um estudo que relaciona os 
EEG's de pacientes com Alzheimer com os seus vo- 
lumes de matéria cinza respectivos, com o objetivo de 
verificar se as anormalidades encontradas nos ritmos 
cerebrais são estritamente relacionadas à neurodege- 
neração (atrofia) do cérebro, como reportado por ou- 
tros trabalhos [10]; 


a utilização da versão generalizada do mapeamento 
GQ com o objetivo de diferenciar idosos sadios da- 
queles com o Declínio Cognitivo Leve e a DA, como 
também identificar as regiões do cérebro mais afetadas 
pela progressão da doença [96]; 


realizar um estudo comparativo da performance das 
técnicas amplamente utilizadas na literatura, incluindo 
o método baseado em grafos de quantis em sua forma 
uni e bidimensional, no que diz respeito à acurácia da 
classificação dos pacientes nos diferentes estágios da 
DA e ao tempo de processamento gasto por tais técni- 
cas; 
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a previsão de convulsões em pacientes com epilepsia, 
já que os resultados aqui apresentados mostram que a 
metodologia proposta se mostrou promissora na identi- 
ficação de crises em pacientes com epilepsia; 


o estudo da doença de Parkinson e do Transtorno do 
Espectro Autista, já que é conhecido na literatura que 
os dados de EEG de pacientes com essa(e) doença/ 
transtorno atuam como biomarcadores neurofisiológi- 
cos da(o) mesma(o). 
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